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Выделены основные классы задач интеллектуального анализа пространственных данных эколого-социально- 
экономического мониторинга, предложены методы и алгоритмы их решения. На реальных показателях 
мониторинга регионов Украины рассмотрены примеры генерирования новых знаний с помощью 
геоиконического моделирования в геоинформационной системе. 


Одной из приоритетных задач мирового сообщества на ХХТ век Организация 
Объединенных Наций провозгласила решение проблемы устойчивого развития (УР). 
Для выхода на траекторию УР необходим научно обоснованный подход к прогно- 
зированию развития регионов (территориальных единиц — областей, районов и т.д.). 
Поэтому возникла проблема количественной оценки уровня УР, мониторинга эколо- 
гических, социальных, экономических (ЭСЭ) показателей. 

Под эколого-социально-экономическим мониторингом (ЭСЭМ) как частью 
системы управления региональным развитием будем понимать специально 
организованное целевое систематическое наблюдение и краткосрочное прогнозирование 
хода важнейших ЭСЭ-процессов с целью их анализа, идентификации и выявления круга 
регулируемых факторов для подготовки и принятия решений. 

Интеллектуальный анализ данных (ИАД) — инструмент для извлечения знаний из 
первичных данных. Цель применения ИАД к решению задач ЭСЭМ регионов — получе- 
ние ранее неизвестных, нетривиальных, доступных для интерпретации ЭСЭ-процессов 
знаний, закономерностей в ЭСЭМ-данных, полезных для поддержки принятия реше- 
ний. В настоящее время из имеющихся данных мониторинга регионов извлекается не 
вся информация. Одной из причин такого положения является недостаточная раз- 
работанность методологии и подходов к интерпретации мониторинговых данных. 

Большинство авторов выделяет пять типов задач ИАД [1]: 1) классификация 
(распознавание с «учителем», ранжирование); 2) кластеризация (определение присущего 
исследуемым данным разбиения на однородные группы — кластеры); 3) выявление 
ассоциаций; 4) выявление последовательностей; 5) прогнозирование. 

ИАД ЭСЭ-мониторинга включает перечисленные пять типов задач. Но сущест- 
вуют некоторые дополнения, связанные с тем, что ЭСЭМ-данные имеют конкретную 
пространственную привязку и предназначены для раннего обнаружения и предупрежде- 
ния негативных тенденций и явлений в ЭСЭ-развитии регионов. Это такие задачи [2]: 

1) выделение аномалий (на основе особенностей протекания ЭСЭ-процессов 
выявляются регионы, ЭСЭ-развитие которых отличается от общей тенденции, при- 
сущей всей совокупности регионов); 

2) анализ и оптимизация сети мониторинга (построение модели для описания 
пространственного распределения точечных объектов — узлов сети мониторинга и 
пространственных отношений между объектами). 


«Штучний 1нтелект» 472008 137 


Сарычева Л.В. 


2С 


Поэтому для извлечения новых знаний из данных мониторинга регионов разраба- 
тываются методы интеллектуального анализа пространственных данных (ИАПД), ис- 
пользующие ИАД и современные геоинформационные системы и технологии 
(ГИС) [3], [4]. ГИС, обеспечивая пространственную привязку информации, не только 
облегчают ее восприятие и интерпретацию, но и обеспечивают получение такой 
производной информации, которая не может быть извлечена по исходным данным при 
использовании других информационных систем [5]. 

Проведенное исследование методов и средств анализа ЭСЭ-показателей в ГИС 
(Агс\Уле\уу, АгсО1з, Мо4Йо\, 14151, Панорама) свидетельствует о том, что ГИС могут 
быть использованы для задач анализа зонирования территории по значениям показате- 
лей ЭСЭ-мониторинга, синтеза тематических пластов картографической экологической 
информации, построения геоиконических моделей ЭСЭ-показателей, определения и 
картирования аномальных с точки зрения УР регионов. 

Применение методов ИАПД позволяет проводить комплексный анализ разно- 
родных данных трех информационных блоков: экологического, экономического, 
социального. Это особенно важно, ведь «математика» при моделировании экологи- 
ческих процессов отличается от «математики» при моделировании социально-эконо- 
мических процессов, а актуальность совместного анализа ЭСЭ-показателей не вызывает 
сомнений. 

Цель работы — исследование и реализация методов интеллектуального анализа 
пространственных ЭСЭМ-данных для поддержки принятия решений по управлению 
региональным развитием, генерирование новых знаний с помощью ГИС-анализа и 
моделирования. 


Постановка задачи 


Объектами ИАПД являются и регионов территории, которые характеризуются т 
ЭСЭ-показателями (признаками), измеренными в определенные моменты времени, и 
географическими координатами. Результаты наблюдений за объектами (в фиксирован- 
ный момент времени) представляются матрицей типа «объект-признак» размера их. 
Число признаков может быть больше числа объектов: >И. 

Для ИАПД ЭСЭ-мониторинга регионов требуется: 1) выделить основные классы 
задач и описать методы их решения; 2) разработать соответствующие алгоритмы 
реализации ИАПД в ГИС. 


ИАГД мониторинга ЭСЭ-показателей регионов: 
задачи, методы и алгоритмы 


Особенности применения методов ИАПД для анализа показателей ЭСЭ- 
мониторинга регионов обусловлены характером исходных данных и содержательной 
постановкой решаемых задач. Одни и те же методы ИАПД используются для 
различных по содержанию задач. Например, кластеризация применяется и для анализа 
сети мониторинга, и для районирования территории (по степени загрязнения, по совокуп- 
ности показателей тематического сюжета «инвестиционная привлекательность» регионов 
ит.п.), и для выделения аномальных регионов. Кластеризация используется как на этапе 
разведочного анализа, так и на этапе извлечения знаний из ЭСЭМ-данных, проверки 
гипотез о сходстве протекающих в различных регионах ЭСЭ-процессов. 

Сравнительная характеристика ИАД и ИАПД представлена в табл. 1. 
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Таблица 1 — Сравнительная характеристика ИАД и ИАПД 
Характеристики ИАД ИАПД 


Обнаружение моделей в Обнаружение пространственных 
данных особенностей в данных 

Разработка гипотез, основанных на 
Разработка гипотез о данных 

«географии» данных 
Составление модельных и 
В Оценка пространственных моделей 


Статистика Геостатистика 


Ранговые картограммы по одном 
Классификация о: о 
двум и трем атрибутам 


Кластеризация Кластеризация 
Правила вывода Правила вывода 


Геоиконическое моделирование, 
интегрированные методы 


Графики КартаНГрафики 


визуализации |Диаграммы Карта+Диаграммы 


Интегрированные методы 


Средства 


результатов 


Гистограммы Карта+Гистограммы 


Основные задачи ИАПД мониторинга ЭСЭ-показателей регионов следующие: 
анализ и оптимизация сети мониторинга, ГИС-анализ и геоиконическое моделирование 
показателей для зонирования территории, обнаружение пространственно-временных 
аномалий, геостатистический анализ, прогнозирование ЭСЭ-показателей (рис. 1). 


ИАД 
Статистический анализ 
Ранжирование 
Распознавание «с учителем» 
Кластеризация 
Выбор информативных 
показателей 
Выделение аномалий 
Анализ и оптимизация сети 
мониторинга 
Прогнозирование 


ГИС — анализ 


местоположения объектов 


распределения числовых 
показателей 
карт плотности 


обьектов внутри области 


окружения 


пространственных 
изменений 
временных изменений 


Геостатистический анализ 


Геоиконическое 


моделирование Генерирование новых 


Ранговые картограммы 


Картоднаграммы 


Аналитические карты 


Комплексные карты 


Синтетические карты 


Виртуальные карты 


Интегральные модели 
регионального анализа 


Модели, основанные на 
пространственных аналогах 


знаний 


Образование новых границ 
(генерализация) 


Гипотезы о связи явлений 
(новые знания) 


Интегральный 
региональный анализ 


Прогноз изменений 


Верификация моделей 


Ассоциация н 
генерирование рассуждений 


НИ ‘Анализ и принятие решений 
(диалог ЛПР-ЭВ№ 


Рисунок 1 — Структурная схема использования методов ИАПД 
для поддержки принятия управляющих решений 


«Штучний 1нтелект» 472008 


139 


Сарычева Л.В. 


2С 


Геоиконические модели — принципиально новый класс ЭСЭ-моделей, основанный 
на иконическом способе отображения ЭСЭ-информации, упорядоченной с помощью 
географической карты. В соответствии с тематическим сюжетом по совокупности 
изучаемых ЭСЭ-показателей создаются карты. Информация представляется для 
дальнейшего анализа в сжатом, синтетическом виде, а карта рассматривается как 
аналитическое средство [6]. 

Геоиконические модели в ГИС обладают важным свойством — это интерактивные 
модели, работающие в режиме взаимодействия ЛПР - ЭВМ. Электронное хранение в 
ГИС геоиконических моделей позволяет буквально за минуту отобразить и 
проанализировать несколько различных ЭСЭ-показателей. В итоге оперативность 
анализа возрастает во много раз. Для ИАПД ЭСЭ-мониторинга целесообразно 
использовать следующие геоиконические модели. 

1. Ранговые картограммы. Регионы, относящиеся к одному классу, выводятся 
на карту однотипно (одним цветом или одинаковой штриховкой). 

2. Картодиаграммы - карты, отражающие распределение какого-либо явления 
посредством диаграмм: линейных и столбчатых, площадных или объемных, 
локализованных по единицам территориального деления; обычно используется для 
показа абсолютных статистических ЭСЭМ-данных. 

3. Аналитические карты, показывающие не обобщенные или малообобщенные 
показатели какого-либо явления. 

4. Комплексные карты, показывающие совместно несколько разных взаимо- 
связанных явлений (или несколько свойств одного явления), но каждое в своей системе 
показателей. 

5. Синтетические карты — дают интегральное представление явления в единых 
синтетических показателях (обычно отражают типологическое районирование террито- 
рии по комплексу показателей), создаются на основе интеграции множества частных 
показателей или аналитических и комплексных карт. При их создании применяются 
методы факторного, кластерного анализа, главных компонент. 

6. Геоиконические модели региональной генерализации. Пространственный аспект 
генерализации связан с отображением формы, размера и положения картографических 
объектов, атрибутивный аспект генерализации связан с обобщением количественных и 
качественных характеристик, агрегированием территориальных единиц при различных 
классификациях. 

7. Интегральные геоиконические модели регионального анализа. Интегрированию 
показателей в ГИС соответствует логическое сложение их картограмм. 

8. Динамические геоиконические модели учитывают фактор времени, 
используются для наглядного представления динамики изменения ЭСЭ-показателей. 

Для ГИС-анализа используется топологическая модель территории, когда важ- 
ны не картометрические характеристики, а аспекты распределения тематических 
признаков (соседство, сочлененность, форма, характер распределения кластеров). 
Электронные карты в ГИС являются базами данных, обеспечивающими интерактивное 
выполнение информационно-поисковых и аналитических процедур путем непосредствен- 
ных указаний на объекты карты. 

Рассмотрим последовательно основные этапы ИАПД мониторинга регионов. 
Для решения задач каждого этапа предложим соответствующие методы и алгоритмы. 

1. Анализ и оптимизация сети мониторинга. Основные методы [2]: 

1) статистические (для проверки гипотезы о соответствии сети мониторинга 
пространственно случайному точечному процессу используются индексы Морисита, 
Фишера, Дэвида-Мура, Дугласа, Ллойда); 

2) геометрические (вычисляются геометрические характеристики: а) расстояния 
между точками — узлами сети мониторинга; 6) площади областей влияния точек; в) мера 
нерегулярности сети); 

3) геостатистические (кригинг и кокригинг); 
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4) кластерные (проверка сети на кластерность, декластеризация); 

5) фрактальные (определяется фрактальная размерность сети мониторинга, напри- 
мер, методами «счета коробок» и «счета песка в коробке»); 

6) интерполяционные (характеристики неравномерности сети вычисляются на 
основе коэффициентов, использующихся при линейной интерполяции величины, для 
которой предназначена анализируемая сеть); 

7) теоретико-графовые (сеть мониторинга представляется в триангулированном 
виде, вычисляются параметры центральности, связности и формы графа). 

Каждый из методов используется для описания определенных характеристик сети 
мониторинга. Исследование сети экологического мониторинга целесообразно прово- 
дить, используя последовательно: сначала геометрический, статистический и теоретико- 
графовый, затем кластерный, геостатистический и интерполяционный, и, наконец, 
фрактальный подходы. Для социально-экономического мониторинга регионов интерпо- 
ляционный и фрактальный подходы неактуальны. Целесообразно использовать данные 
статистических управлений регионов и Госкомстата [7] по административной сети 
территориального деления, «привязывая» экологические показатели. 

На рис. 2 приведен пример гистограмм расстояний между региональными цент- 
рами в Европе, Украине и Днепропетровской области (геометрический метод). Полу- 
ченные гистограммы подобны, присутствие кластеров не наблюдается (рост числа пар с 
ростом расстояния указывает на наличие кластеров, равномерный рост означает нали- 
чие одного кластера, рост скачками — наличие нескольких кластеров). 
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Расстояние, ‘км 


7 


Чии= 138 км 
Чнах= 5177 км 
Интервалы 
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801 сз 
60 
Днепропет- 


ровская 
область 20 


77 


52 


30 


3 4 5 
Расстояние, км 


Чин= 14 км 
Чнах= 268 км 
Интервалы 
1. 14 — 64 

2. 64 —114 
3. 114 - 163 
4. 163 — 213 
5. 213 — 268 


Рисунок 2 — Пример применения геометрического метода анализа сети мониторинга 
(гистограммы расстояний между региональными центрами в Европе, 
Украине и Днепропетровской области) 
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П. Разведочный анализ ЭСЭ-показателей. 

ЭСЭ-показатели имеют разный диапазон изменений (измерены в различных 
шкалах, характеризуют разные свойства и т.д.). Непосредственное использование их 
в анализе может привести к тому, что классификацию будут определять показатели, 
имеющие наибольший разброс значений. Поэтому применяются следующие виды 
стандартизации: 1) «/-шкалы», 2) «разброс от 0 до 1», 3) «максимум -— 1», 4) «сред- 
нее — 1», 5) «стандартное отклонение - 1», 6) «разброс от —1 до 1», 7) центрирование 
и масштабирование на среднее значение и другие [2]. 

В геоинформационной системе (ГИС) проводится классификация регионов по 
одному, двум (например, рождаемость — смертность, объемы экспорта — импорта и др.) 
показателям ЭСЭ-мониторинга и строятся ранговые картограммы. При их построении 
используются следующие схемы классификации: 1) естественная разбивка, 2) равные 
интервалы, 3) квантиль, 4) стандартное отклонение (основные схемы классификации в 
ГИС, их достоинства и недостатки, а также соответствующие им алгоритмы приведены в 
работах [8], [9]. Они позволяют отобразить, например, 20 % регионов с наилучшими (или 
наихудшими) значениями ЭСЭ-показателя (схема квантиль, 5 классов) или регионы со 
значением показателей, отличающимися от соответствующего среднего не более, чем на 
половину стандартного отклонения. 

Для выделения регионов с заданными свойствами ЭСЭ-показателей используется в 
ГИС блок статистического анализа свойств отдельного атрибута и блок логических 
операций. Например, в рамках тематического сюжета «смертность + рождаемость + 
индекс продолжительности жизни (рассчитанный по методике ПРООН)», вычисляются 
средние значения показателей. 

Они используются для составления логических выражений вида 
([Н1994]<12)апа([Р1994]>14.5)апа([Р1997]>15), позволяющих задавать диапазоны 
изменения ЭСЭ-показателей (Н1994, Р1994, Р1997 — названия атрибутов). 
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Рисунок 3 — Выделение в ГИС регионов, по которым в 1991 — 2000 гг. 
показатель «Количество умерших (всего, на 1000 населения)» выше среднего 
значения по Украине (цифра — индекс продолжительности жизни, 2000) 
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С помощью ГИС-анализа выделяются регионы, по которым в 1991-2000 гг. 
показатель «Количество умерших (всего, на 1000 имеющегося населения)» выше средне- 
го значения по Украине (рис. 3). В результате — заслуживающая внимания ЛПР картина: 
10 выделенных регионов (Киевская, Черниговская, Сумская, Харьковская, Полтавская, 
Кировоградская, Черкасская, Житомирская, Винницкая, Хмельницкая области) образуют 
единое «пятно» на карте Украины. Индекс продолжительности жизни для этих регионов 
не является худшим (в Донецкой, Днепропетровской, Луганской, Запорожской, Нико- 
лаевской, Херсонской областях он хуже). Можно предположить, что такая картина рас- 
пределения показателя смертности связана с Чернобыльской трагедией. 

Одновременный анализ ранговых картограмм (с сопоставимыми градациями) в 
последовательные моменты времени дает представление о динамике процесса 
изменения ЭСЭ-показателя. 

Например, анализ картограмм заработной платы по регионам Украины за 
1995 — 2000 гг. свидетельствует о расслоении общества (регионов). Палитра карты 
1995 года пестрит разнообразием цветов, число регионов, окрашенных в разные 
цвета (из 5-ти градаций), приблизительно одно и то же. Карты последующих лет 
постепенно теряют пестроту, приобретая оттенки двух градаций, а карта 2000 года 
окрашена преимущественно в два цвета, соответствующие градациям больших и 
малых значений заработной платы, регионов с остальными тремя градациями мало. 

При анализе нескольких временных ранговых картограмм одного показателя 
проводится сравнительный анализ различных картограмм и поиск пространственных 
аналогов, выделяются региональные зоны. Создаются геоиконические модели «ре- 
гиональной генерализации» [6], получаемые путем сравнительного анализа различ- 
ных картограмм и поиска пространственных аналогов (рис. 4). 


Рисунок 4 — Объединение зон при создании геоиконической модели региональной 
генерализации 


На рис. 5 представлены примеры анализа тематического сюжета «Рождаемость и 
смертность населения регионов Украины, 2000». Отчетливо видны тренды, присутству- 
ющие в распределении показателей рождаемость (рис. 5а) и смертность (рис. 56). 
Каждая вертикальная линия на этих графиках представляет местоположение региона 
и значение соответствующего показателя (начало координат — на юго-западе). При 
проектировании на перпендикулярные плоскости видны диаграммы рассеяния и 
линии регрессии. Рождаемость уменьшается, а смертность населения возрастает в 
направлении с запада на восток. Оба эти показателя увеличиваются в направлении с 
юга на север. 
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Рисунок 5 — Фрагменты пространственного анализа показателей рождаемости (а) 
и смертности (6) населения регионов Украины, 2000 


Мониторинг временных изменений одного ЭСЭ-показателя отображается (на 
картограмме показателя за последний наблюдаемый год) с помощью картодиаграм- 
мы — для каждого региона строятся диаграммы значений показателя за этот год и 
несколько предыдущих. 

Пары показателей анализируются с помощью диаграмм рассеяния. Далее применя- 
ются методы: главных компонент, корреляционный, факторный, дисперсионный анализ 
показателей [10]. Выбираются показатели для дальнейшего анализа. 

Ш. С помощью многомерного регрессионного анализа и метода группового 
учета аргументов (МГУА) [11], [12] находятся модели зависимостей между 
исследуемыми показателями. Применение алгоритмов МГУА обусловлено тем, 
что задачи моделирования поставлены в условиях структурной неопределенности по 
количеству и составу входных переменных в моделях. 

Если результаты моделирования неудовлетворительны, то проводится кластериза- 
ция регионов по исследуемому набору показателей и строятся многомерные модели для 
каждого кластера отдельно. Визуализация результатов кластеризации и регрессионного 
анализа проводится в ГИС в виде одной карты «ранговая картограмма классов + карто- 
диаграмма со значениями ошибок, коэффициента детерминации, выходов регрес- 
сионной модели». 

ГУ. Обнаружение пространственной автокорреляции (подобие значений 
показателей в соседних регионах) с помощью построения диаграммы рассеяния 
(на вертикальной оси — значения показателей данного региона, а на горизонталь- 
ной — средние значения соответствующих показателей в смежных регионах). 
Геостатистический анализ (построение пространственных вариограмм показателей в 
ГИС и пространственно-временных вариограмм) [13]. Обнаружение автокорреляции 
в регрессионных «остатках». 

Анализируя типичные облака вариограмм ЭСЭ-показателей и соответствующие 
модели вариограмм, примеры которых показаны на рис. 6, заметим, что пары точек (точ- 
ки имеют координаты центров регионов), расположенные близко друг к другу (точки в 
начале оси ОХ), имеют сходные значения (низкие значения на оси ОУ). Наблюдается 
также постепенное уменьшение пространственной автокорреляции (соответственно, уве- 
личение дисперсии) до некоторого расстояния (радиуса влияния), за пределами которого 
автокорреляция равна нулю. Радиус влияния используется для определения области 
влияния — совокупности регионов-соседей данного региона. 

У. Кластеризация регионов по совокупности ЭСЭ-показателей (или по 
«остаткам» лучших регрессионных моделей) с применением алгоритма СЕОТТМЕ [14] 
для пространственно-временных данных. Для оценки качества кластеризации 
используются внешние критерии МГУА [15]. Просмотр результатов в ГИС, создание 
синтетических карт [6]. 
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Рисунок 6 — Моделирование вариограммы показателя «Валова додана варт!сть на 
душу населення Укратни, 1997 — 2000» (экспоненциальная модель) 


Важным в задачах ранжирования, распознавания и в кластерном анализе является 
выбор меры сходства (между объектами, между объектом и кластером, между кла- 
стерами, между кластеризациями, между признаками объектов), от которого решающим 
образом зависит окончательный вариант разбиения объектов на классы при заданном 
алгоритме разбиения. В каждой конкретной задаче этот выбор производится с учетом 
главных целей исследования. Основные меры сходства представлены в работе [15]. 
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Рисунок 7 — Кластеризация регионов Украины по совокупности показателей, 
влияющих на формирование небезопасных геологических явлений, 2003 г. 


Пример использования (для районирования территории Украины) кластеризации 
регионов по совокупности 9-ти показателей, влияющих на формирование небезопасных 
геологических явлений (производство промышленной продукции на душу населения, 
грн.; объем забора воды с поверхностных источников, млн куб. м; объем забора воды 
с подземных источников, млн куб. м; объем сброса оборотных вод, млн куб. м; лесис- 
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тость региона, %; площадь сдвигов, кв. км; площадь распространения пород, склонных 
к проседанию, кв. км; площадь, пораженная овражной эрозией, кв. км; площадь рас- 
пространения карстовых явлений, кв. км, 2003 г.) приведен на рис. 7. 

Выделяются шесть территориальных зон: 1) Донецкая + Луганская, 2) Днепро- 
петровская + Запорожская, 3) АР Крым, 4) Закарпатская + Ивано-Франковская + Черно- 
вицкая, 5) Киевская + Полтавская + Харьковская + Кировоградская + Винницкая + 
+ Николаевская + Одесская + Херсонская, 6) остальные 9 областей. 

УТ. Ранжирование регионов по степени близости к заданному одному региону 
или заданной совокупности регионов. Задание эталонных классов и распознавание «с 
учителем». При распознавании «с учителем» в ГИС выполняются два типа процедур: 
оценивание сходства между географическими объектами слоя и набором эталонных 
объектов при заданном множестве атрибутивных свойств (с выбором оптимального 
подмножества); распознавание пространственно координированных объектов в слое 
по выборке эталонных объектов нескольких классов при заданном множестве 
атрибутивных свойств (с выбором оптимального подмножества). 

УП. Обнаружение пространственно-временных аномалий. 

Строгого математического определения аномалии регионального развития и 
границы области устойчивости для ЭСЭ-показателей не существует, хотя для некоторых 
показателей известны диапазоны изменения значений. Аномалиям временных тенденций 
развития соответствует значительный постоянный рост или спад ЭСЭ-показателей 
региона-аномалии, а многомерным аномалиям в рамках выбранного тематического 
сюжета соответствуют полярные «хвосты» распределений. Подразумевается, что ано- 
малии могут быть как положительные, так и отрицательные. 

Методы и алгоритмы выделения аномалий регионального развития охватывают 
подходы: а) на основе применения кластерного анализа, 6) поляризации, в) анализа 
регрессионных остатков, г) адаптивности и разнообразия, д) мер сходства между 
объектом и классом [2]. Выделяются аномалии тенденций временного развития и 
аномалии в рамках заданного тематического сюжета. 

В случае короткого временного интервала вычисляются скорости и ускорения 
ЭСЭ-показателей, а затем проводится трехмерная (показатель + скорость + ускоре- 
ние) классификация в ГИС. На одной геоиконической модели можно отразить теку- 
щее значение, скорость и ускорение ЭСЭ-показателя и оперативно провести их 
анализ (например, выявить регионы с низким уровнем финансового благополучия, 
которое к тому же еще и снижается, причем наиболее быстрыми темпами). В резуль- 
тате получается интегральная характеристика, учитывающая не только величину 
самого показателя, но и его динамические характеристики — первую и вторую произ- 
водные по времени. 

Для анализа длинных временных рядов наряду с традиционными используется 
метод, основанный на выделении «периферийных» регионов. При обнаружении 
пространственных аномалий анализируется синтетическая карта «экстремумы» [6]. 

УШ. Прогнозирование. Для прогнозирования значений ЭСЭ-показателей исполь- 
зуется алгоритм структурной идентификации [16], основанный на МГУА, с выбором 
набора показателей. 

МГУА позволяет получать модели с наилучшими прогнозирующими свойст- 
вами, так как направлен на выбор моделей, уменьшающих ошибку прогнозирования: 
в простейшем случае выборка делится на две части, на одной из которых генери- 
руется множество моделей, а на второй вычисляется ошибка каждой модели и 
выбирается та, которая лучше работает «в режиме прогнозирования». 
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Для прогнозирования показателей, имеющих пространственную привязку, пред- 
ставляется целесообразным учитывать тот факт, что географически близко располо- 
женные объекты являются более похожими друг на друга, чем расположенные на 
большом расстоянии (для объектов с экологическими показателями это очевидно). Этот 
факт можно учитывать двумя способами: 1) на этапе генерации структур непосредствен- 
ным введением в модель в качестве переменных географических координат; 2) на этапе 
задания критерия и выбора оптимальной модели. 

В процессе ИАПД ЭСЭ-мониторинга конечный выбор технологической цепочки 
применяемых методов зависит от конкретных данных мониторинга, целевых установок 
и опыта исследователя. Но при этом исследователь может воспользоваться приведенной 
последовательностью (Т— УШ) этапов и предложенными методами, отражая промежу- 
точные результаты в ГИС для пространственного анализа. 

Процедуры извлечения из ЭСЭМ-данных новых знаний на основе ГИС- 
анализа, ИАД и геоиконического моделирования следующие. 

1. Региональная генерализация границ на основе ранговых картограмм, регио- 
нальная генерализация границ на основе оверлея полигонов. 

2. Выявление закономерностей территориального распределения многомерных 
аномалий. 

3. Комплексный анализ ЭСЭ-развития регионов на базе синтеза и агрегирования в 
ГИС результатов статистической отчетности. 

4. Обнаружение пространственных взаимосвязей между разнородными 
ЭСЭ-показателями с помощью сравнительного анализа ранговых картограмм. 

5. Сопоставление региональных многомерных регрессионных моделей зависи- 
мостей между ЭСЭ-показателями и результатов геоиконического моделирования 
остатков регрессионных моделей, нахождение объяснения остаткам и уточнение 
модели. 

6. Выявление тенденций динамики изменений региональных ЭСЭ-показа- 
телей и т.д. 


Выводы 


Классифицированы задачи интеллектуального анализа ЭСЭМ-данных. Дана 
сравнительная характеристика ИАД и ИАПД по целям, методам и способам визуа- 
лизации результатов. 

Изложены особенности применения ГИС для задач ЭСЭМ, методы и средства ГИС- 
анализа пространственно распределенной ЭСЭ-информации. Классифицированы гео- 
иконические модели для ИАПД ЭСЭ-показателей. Рассмотрены основные этапы ИАПД 
мониторинга регионов. На реальных данных показано, что применение ИАПД и 
ГИС-технологий позволяет уточнять первичные ЭСЭМ-данные и получать новую 
информацию, которая обычно не учитывается официальной статистикой. 

Предложены процедуры извлечения из ЭСЭМ-данных новых знаний на основе 
ГИС-анализа, ИАД и геоиконического моделирования. 

Эффективность ГИС-анализа при решении задач устойчивого развития может 
быть повышена за счет новейших аналитических, графических и анимационных 
возможностей ГИС будущих поколений. Требуется привлечение новых методов 
многомерного анализа пространственных данных, поддержка интерактивного управ- 
ления картографикой и обеспечение подсветки анализируемых объектов во всех 
открытых окнах: картографических, графических и табличных. 
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2С 


В идеале — полученная из разных источников ЭСЭ-информация в реальном 
масштабе времени в компьютерной сети в интерактивном режиме синтезируется, 
преобразуется в «разумное изображение», гипергеоиконическую модель, которая 
наглядно отображает свойства изучаемых многомерных данных ЭСЭ-мониторинга 
для задач регулирования УР. 
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Л.В. Саричева 

Тнтелектуальний анал показникв еколого-сощально-економ1чного мон!горингу ретон1в 
Виден! основн! класи завдач 1нтелектуального анал!зу просторових даних еколого-сошально- 
економ!чного монторингу, запропонован! методи 1 алгоритми 1х розв’язання. На реальних показниках 
мон!торингу регонв Украни розглянуп приклади генерування нових знань за допомогою 
геокон!чного моделювання в гео1нформащйвй систем. 


Г. загусйеуа 

'Тве ПиеШоепсе Апа]у$15 07 Рагатеег$ Есо1021са!-50с10-Есопопис МопНогто оЁ Фе Вео10п$ 

ТБе Баз1с с1аззез оЁ фе пиеШзепсе апа[уз1$ 1азК$ о Ве зрана| даа оЁ есо]огу-50с10-есопопс топйогте 
аге ехтасе4, фе те о4$ ап4 аеогИил$ о Фет зо]уше аге оЁегед. Тве ехатр[ез оЁ пем Кпо\еазе 
сепеганоп изше ео1соп1с зпачаноп ш а зеошЮгтайоп зузет аге загуеуе УИ чзасе оЁ асбла1 
рагатейег$ оРОКгаше гез10п$ попйоге. 
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